检索结果

Select

1. 融合多时间尺度和特征加强的知识图谱推荐模型

张素琪, 王鑫鑫, 佘世耀, 顾军华

《计算机应用》唯一官方网站 2022, 42 (4): 1093-1098. DOI: 10.11772/j.issn.1001-9081.2021071241

摘要（361）

HTML （15）

PDF （582KB）（202）

针对现有的知识图谱推荐模型没有考虑到用户的周期特征以及待推荐项目会对用户近期兴趣产生影响的问题，提出一种融合多时间尺度和特征加强的知识图谱推荐模型（MTFE）。首先，采用长短期记忆（LSTM）网络在不同时间尺度上挖掘用户的周期特征并融入到用户表示中；然后，通过注意力机制挖掘待推荐项目中与用户近期特征相关性较强的特征，将其加强后融入项目表示中；最后，通过评分函数计算用户对待推荐项目的评分。在真实数据集Last.FM、MovieLens-1M和MovieLens-20M上把所提模型和个性化实体推荐（PER）、协同知识嵌入（CKE）、LibFM、RippleNet、知识图卷积网络（KGCN）、协同知识感知注意网络（CKAN）等知识图谱推荐模型进行对比。实验结果表明，在三个数据集上MTFE相较于表现最优的对比模型的F1性能分别提升了0.78、1.63和1.92个百分点，AUC指标在三个数据集上分别提升了3.94、2.73和1.15个百分点。可见，所提模型相较于对比图谱推荐模型有更好的推荐效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 融合协同过滤信息的知识图注意力网络

顾军华, 王锐, 李宁宁, 张素琪

《计算机应用》唯一官方网站 2022, 42 (4): 1087-1092. DOI: 10.11772/j.issn.1001-9081.2021071269

摘要（349）

HTML （13）

PDF （558KB）（146）

知识图谱（KG）能够缓解协同过滤算法存在的数据稀疏和冷启动问题，在推荐领域被广泛地研究和应用。现有的很多基于KG的推荐模型混淆了用户物品二部图中的协同过滤信息和KG中实体间的关联信息，导致学习到的用户向量和物品向量无法准确表达其特征，甚至引入与用户、物品无关的信息从而干扰推荐。针对上述问题提出一种融合协同信息的知识图注意力网络（KGANCF）。首先，为了避免KG实体信息的干扰，网络的协同过滤层从用户物品二部图中挖掘出用户和物品的协同过滤信息；然后，在知识图注意力嵌入层中应用图注意力机制，从KG中继续提取与用户和物品密切相关的属性信息；最后，在预测层将用户物品的协同过滤信息和KG中的属性信息融合，得到用户和物品最终向量表示，进而预测用户对物品的评分。在MovieLens-20M和Last.FM数据集上进行了实验，与协同知识感知注意力网络（CKAN）相比，KGANCF在MovieLens-20M数据集上的F1分数提升了1.1个百分点，曲线下面积（AUC）提升了0.6个百分点；而在KG相对稀疏的Last.FM数据集上，模型的F1分数提升了3.3个百分点，AUC提升了8.5个百分点。实验结果表明，KGANCF能够有效提高推荐结果的准确度，在KG稀疏的数据集上显著优于协同知识嵌入（CKE）、知识图谱卷积网络（KGCN）、知识图注意网络（KGAT）和CKAN模型。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于知识图偏好注意力网络的长短期推荐模型及其更新方法

顾军华, 樊帅, 李宁宁, 张素琪

《计算机应用》唯一官方网站 2022, 42 (4): 1079-1086. DOI: 10.11772/j.issn.1001-9081.2021071242

摘要（465）

HTML （27）

PDF （785KB）（175）

目前，知识图谱推荐的研究主要集中在模型建立和训练上。然而在实际应用中，需要使用增量更新方法定期更新模型来适应新用户和老用户偏好的改变。针对大部分该类模型仅利用用户的长期兴趣表示做推荐，而没有考虑用户的短期兴趣且聚合邻域实体得到项目向量表示时聚合方式的可解释性不足，以及更新模型的过程中存在灾难性遗忘的问题，提出基于知识图偏好注意力网络的长短期推荐（KGPATLS）模型及其更新方法。首先，通过KGPATLS模型提出偏好注意力网络的聚合方式以及结合用户长期兴趣和短期兴趣的用户表示方法；然后，为了缓解更新模型存在的灾难性遗忘问题，提出融合预测采样和知识蒸馏的增量更新方法（FPSKD）。将提出的KGPATLS模型和FPSKD方法在MovieLens-1M和Last.FM两个数据集上进行实验。相较于最优基线模型知识图谱卷积网络（KGCN），KGPATLS模型的曲线下面积（AUC）指标在两个数据集上分别有2.2%和1.4%的提升，准确率（Acc）指标分别有2.5%和2.9%的提升。在两个数据集上对比FPSKD与三个基线增量更新方法Fine Tune、Random Sampling、Full Batch，FPSKD在AUC和Acc指标上优于Fine Tune、Random Sampling，在训练时间指标上FPSKD分别降低到Full Batch的大约1/8和1/4。实验结果验证了KGPATLS模型的性能，而FPSKD在保持模型性能的同时可以高效地更新模型。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 融合语义标签和噪声先验的图像生成

张素素, 倪建成, 周子力, 侯杰

计算机应用 2020, 40 (5): 1431-1439. DOI: 10.11772/j.issn.1001-9081.2019101757

摘要（406）

PDF （2335KB）（369）

针对现有生成模型难以直接从复杂语义标签生成高分辨率图像的问题，提出了融合语义标签和噪声先验的生成对抗网络(SLNP-GAN)。首先，直接输入语义标签（包含形状、位置和类别等信息），使用全局生成器对其进行编码，并结合噪声先验来学习粗粒度的全局属性，初步合成低分辨率图像；然后，基于注意力机制，使用局部细化生成器来查询低分辨率图像子区域对应的高分辨率子标签，获取细粒度信息，从而生成纹理清晰的复杂图像；最后，采用改进的引入动量的Adam算法(AMM)算法来优化对抗训练。实验结果表明，与现有方法text2img相比，所提方法的像素精确度（PA）在COCO_Stuff和ADE20K数据集上分别提高了23.73%和11.09%；相较于Adam算法，AMM算法收敛速度提升了约一倍，且损失值波幅较小。可见，SLNP-GAN能高效地获取全局特征和局部纹理，生成细粒度、高质量的图像。

参考文献 | 相关文章 | 多维度评价

Select

5. 求解最大团问题的并行多层图划分方法

顾军华, 霍士杰, 武君艳, 尹君, 张素琪

计算机应用 2018, 38 (12): 3425-3432. DOI: 10.11772/j.issn.1001-9081.2018040934

摘要（574）

PDF （1254KB）（346）

在当今大数据环境下，针对图中节点的海量性和分析的复杂性对最大团问题的研究在速度和精度上都提出了更高要求的问题，提出求解最大团问题的并行多层图划分方法（PMGP_SMC）。首先，提出一种新的多层图划分（MGP）方法，在保持原有图的团结构不被破坏的情况下对大规模图例划分产生子图，并对规模较大的子图进行多层图划分，进一步缩小子图规模，并且应用GraphX图计算框架实现MGP，形成并行MGP（PMGP）方法；然后，依据划分后的子图规模，减少了惩罚值局部搜索算法（PBLS）的迭代次数，提出基于速度优化的PBLS（SPBLS）来求解划分后的各个子图的最大团；最后，将PMGP和SPBLS相结合形成PMGP_SMC。采用Stanford大规模数据集运行测试，实验结果表明，PMGP相比并行单层图划分方法（PSGP），求得的最大子图规模能缩小至原来的1/100，平均子图规模能缩小至原来的1/2；PMGP_SMC相比求解最大团问题的PSGP（PSGP_SMC），总体时间缩短至原来的1/100，并且PMGP_SMC求解最大团的精度和基于极大团枚举求解最大团问题的并行多层图划分方法（PMGP_MCE）一致。PMGP_SMC能够快速精准地求解大规模图例的最大团。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于Spark的并行FP-Growth算法优化及实现

顾军华, 武君艳, 许馨匀, 谢志坚, 张素琪

计算机应用 2018, 38 (11): 3069-3074. DOI: 10.11772/j.issn.1001-9081.2018041219

摘要（975）

PDF （928KB）（636）

为了进一步提高在Spark平台上的频繁模式增长（FP-Growth）算法执行效率，提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先，从频繁模式树（FP-Tree）规模大小和分区计算量对F-List分组策略进行改进，保证每个分区负载总和近似相等；然后，通过创建列表P-List对数据集划分策略进行优化，减少遍历次数，降低时间复杂度。实验结果表明，BFPG算法提高了并行FP-Growth算法挖掘效率，且算法具有良好的扩展性。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于MapReduce的大数据主动学习

翟俊海, 张素芳, 王聪, 沈矗, 刘晓萌

计算机应用 2018, 38 (10): 2759-2763. DOI: 10.11772/j.issn.1001-9081.2018041141

摘要（527）

PDF （751KB）（447）

针对传统的主动学习算法只能处理中小型数据集的问题，提出一种基于MapReduce的大数据主动学习算法。首先，在有类别标签的初始训练集上，用极限学习机（ELM）算法训练一个分类器，并将其输出用软最大化函数变换为一个后验概率分布。然后，将无类别标签的大数据集划分为 l个子集，并部署到 l个云计算节点上。在每一个节点，用训练出的分类器并行地计算各个子集中样例的信息熵，并选择信息熵大的前 q个样例进行类别标注，将标注类别的 l× q个样例添加到有类别标签的训练集中。重复以上步骤直到满足预定义的停止条件。在Artificial、Skin、Statlog和Poker 4个数据集上与基于ELM的主动学习算法进行了比较，结果显示，所提算法在4个数据集上均能完成主动样例选择，而基于ELM的主动学习算法只在规模最小的数据集上能完成主动样例选择。实验结果表明，所提算法优于基于极限学习机的主动学习算法。

参考文献 | 相关文章 | 多维度评价

Select

8. 新型超字级并行改进算法

张素平, 韩林, 丁丽丽, 王鹏翔

计算机应用 2017, 37 (2): 450-456. DOI: 10.11772/j.issn.1001-9081.2017.02.0450

摘要（558）

PDF （1269KB）（473）

对于超字级并行（SLP）算法不能有效地处理大型程序中并行代码率较小，且可向量化的代码中可能存在对向量化不利的代码的问题，提出了一种新型的SLP改进算法NSLPO。首先，将程序中不能向量化的非同构语句进行同构化处理，定位SLP丢失的向量化机会；然后，通过冗余节点添加构建最大通用子图，通过冗余删除等优化过程得到同构化之后的补充SLP图，提高程序中代码的并行性；最后，运用节流法将对向量化有害的代码摒除在向量化之外，仅对它们进行标量处理，通过只向量化处理那些向量化有收益的代码以尽可能地提升程序效率。在一组广泛使用的内核测试集中进行实验，结果显示，与SLP算法相比，NSLPO算法性能更优，其执行时间比SLP平均减少9.1%。

参考文献 | 相关文章 | 多维度评价

Select

9. 基于Hadoop的IPTV隐式评分模型

顾军华, 官磊, 张建, 高星, 张素琪

计算机应用 2017, 37 (11): 3188-3193. DOI: 10.11772/j.issn.1001-9081.2017.11.3188

摘要（539）

PDF （867KB）（458）

根据网路协定电视（IPTV）用户收视行为数据中的隐式特性，提出一种新型的隐式评分模型。首先，介绍了IPTV用户收视行为数据的主要特点，提出一种新的用户收视比值、用户兴趣偏置因子以及视频类型影响因子相结合的多特征混合隐式评分模型；然后，提出基于收视时长和收视比值的收视行为筛选策略；最后，设计并实现了基于Hadoop的分布式模型架构。实验结果表明，所提模型有效提高了IPTV系统中推荐结果的质量，同时提升了时间效率，对于大规模数据有良好的可扩展性。

参考文献 | 相关文章 | 多维度评价

Select

10. 基于形式概念分析的图像场景语义标注模型

张素兰, 张继福, 胡立华, 褚萌

计算机应用 2015, 35 (4): 1093-1096. DOI: 10.11772/j.issn.1001-9081.2015.04.1093

摘要（705）

PDF （590KB）（632）

为生成有效表示图像场景语义的视觉词典,提高场景语义标注性能,提出一种基于形式概念分析(FCA)的图像场景语义标注模型。该方法首先将训练图像集与其初始的视觉词典抽象为形式背景,采用信息熵标识了各视觉单词的权重,并分别构造了各场景类别概念格结构;然后再利用各视觉单词权重的均值刻画概念格内涵上各组合视觉单词标注图像的贡献,按照类别视觉词典生成阈值,从格结构上有效提取了标注各类场景图像语义的视觉词典;最后,利用K最近邻标注测试图像的场景语义。在Fei-Fei Scene 13类自然场景图像数据集上进行实验,并与Fei-Fei方法和Bai方法相比,结果表明该方法在β=0.05和γ=15时,标注分类精度更优。

参考文献 | 相关文章 | 多维度评价

Select

11. 基于图像块分类器和条件随机场的显微图像分割

阳维张树恒王莲芸张素

计算机应用 2011, 31 (08): 2249-2252. DOI: 10.3724/SP.J.1087.2011.02249

摘要（1553）

PDF （611KB）（782）

针对花粉显微图像处理提出了一种自动分割方法，将有助于花粉识别系统的开发。使用归一化颜色分量训练图像块分类器，并且结合条件随机场和图割进行建模和优化，利用最大化后验概率(MAP)的方法实现花粉显微图像中花粉区域的分割。对于实验中的133幅图像，自动分割同人工分割的结果相比较，统计得到距离误差均值为7.3像素，准确率的平均值为87%。实验结果表明，使用图像块分类器和条件随机场模型可以用于花粉图像的分割。

参考文献 | 相关文章 | 多维度评价

Select

12. 基于剪枝的约束概念格的渐进式构造算法

马洋张继福张素兰

计算机应用 2009, 29 (05): 1397-1400.

摘要（1179）

PDF （684KB）（1342）

约束概念格是数据分析的一种有效工具，在其构造的过程中，大量的内涵之间比较操作是导致格的构造效率低下的主要原因之一。采用剪枝技术来消除构造过程中存在的冗余内涵比较，给出约束概念格渐进式构造算法PCCL。该算法利用父子节点内涵的严格单调关系，自顶向下扫描格节点，减少了新增对象属性集与原概念格节点内涵的比较次数，从而提高了约束概念格的构造效率。最后以天体光谱数据作为形式背景，实验验证了PCCL算法的正确性，且构造效率平均提高了15%以上。

相关文章 | 多维度评价

Select

13. 基于SPSS的可重构统计过程控制系统

张素梅

计算机应用

摘要（1166）

PDF （646KB）（841）

为满足制造企业多样、敏捷的统计过程控制（SPC)需求，实现单元应用以及与其他制造信息系统的集成应用，通过分析和构建SPC领域模型，提出并实现了基于社会科学统计软件包(SPSS)的可重构统计过程控制系统。通过引入SPSS组件，执行SPSS Syntax命令，基于SPSS强大的统计分析功能实现对SPC的可视化统计分析，并以具有扩展点的组件化可重构架构满足企业应用模式和配置模式的可重构需求。最后以实例说明系统具有良好的可用性，为制造企业全面质量控制提供了一种数字化手段和应用平台。

相关文章 | 多维度评价

Select

14. 一种改进的快速多分辨率运动估计算法

张素文杨富森汪丽丽

计算机应用

摘要（1662）

PDF （1062KB）（1053）

提出一种改进的快速多分辨率运动估计算法，利用小波的多分辨率特性和小波匹配误差特性，在部分失真消元(PDE)算法的基础上，通过改进搜索顺序、匹配顺序和比较间隔来提高运动估计的速度。实验结果表明:该算法能达到全搜索算法(FSA)的精度，同时有效降低了计算复杂度。

相关文章 | 多维度评价

Select

15. 基于球边界的不平衡数据分类方法

雷治军张素玲薛贞霞

计算机应用

摘要（1647）

PDF （569KB）（812）

现有分类算法对不平衡数据挖掘通常表现出有偏性，即正类样本(通常是更重要的一类)的分类和预测性能差于负类样本的分类和预测性能，为此提出一种不平衡数据的分类方法。该方法对不同类引入不同的惩罚参数来灵活控制两类错分率的上界，通过一个超球面将两类数据以最大分离比率分离，从而提高不平衡数据对正类分类和预测的性能。实验结果表明，该方法可以有效提高不平衡数据的分类性能。

相关文章 | 多维度评价

Select

16. 基于剪枝的概念格渐进式构造

胡立华张继福张素兰

计算机应用

摘要（1602）

PDF （565KB）（861）

概念格是形式概念分析中的核心数据结构。然而，随着需要分析处理的数据量日益剧增，概念格的构造效率成为一个关键问题。采用剪枝方法，消除了概念格构造过程中产生的冗余信息，提出了一种基于剪枝的概念格渐进式构造算法（Pruning based Concept Lattice，PCL），从而减少了概念格内涵的比较次数，提高了概念格的构造效率。采用恒星天体光谱数据作为形式背景，实验验证了算法PCL的正确性和有效性。

相关文章 | 多维度评价

Select

17. CCML2017+会议编号352+基于Hadoop的IPTV隐式评分模型

顾军华官磊张建高星张素琪

录用日期: 2017-07-05